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Vorrichtung und Verfahren zum Verbergen von Informationen 
und Vorrichtung und Verfahren zum Extrahieren von 

Informationen 





Beschreibuna 

Die vorliegende Erfindung bezieht sich auf die Stegano- 
graphie und insbesondere auf ein steganographisches Konzept, 
das maximale Sicherheit liefert, derart, daB kein Verdacht 
geschopft wird, daB ein Text verborgene Informationen ent- 
halt. 

GrundsStzlich bezieht sich die Steganographie auf ein Gebiet 
der Technik, in dem versucht wird, geheime Nachrichten in 
anderen Nachrichten zu verstecken, derart, daB ein Nicht- 
Befugter uberhaupt keinen Verdacht schopft, daB in der ihm 
vorliegenden Nachricht eine geheime Nachricht versteckt ist. 
Damit kann im Gegensatz zur Kryptographie, d. h. dem Ver- 
schlusseln von Nachrichten, ein effektiver Schutz geheimer 
Nachrichten erreicht werden, da ein Nicht-Bef ugter uberhaupt 
keinen Verdacht schopft, daB eine Nachricht eine geheime 
Nachricht enthalt. Dagegen kann man verschliisselten Nach- 
richten ohne weiteres ansehen, daB sie verschliisselt sind. 
Es existieren viele Techniken, urn Verschliisselungen zu 
"knacken". In der Technik besteht ein Konsens daruber, daB 

-anrf~beriebige~~ Art - und"We±se _ verschlusselte— Nachri-chten— mit- 
einem beliebig hohen Auf wand entschliisselt werden konnen. 

,ixi.e Anstrenctuna^n in den. Kryptoxtrapllle konzentr ieren sich 



daher insbesondere darauf, den Auf wand fur einen unbefugten 
Entschliissler so groB als moglich zu machen, derart, daB er, 
abgeschreckt von dem hohen Auf wand, von einem unbefugten 
Entschlusseln der verschliisselten Nachrichten absieht. Unter 
bestimmten Umstanden wird jedoch ein beliebig hoher Aufwand 
in Kauf genommen, urn besonders wichtige Nachrichten ent- 
schlusseln zu konnen. Man nimmt an, daB es fiir viele der 
bekannten Verschlusselungsverf ahren intelligentere aber 
dafiir weniger aufwendige Verfahren zum "Knacken" gibt. Fiir 
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keines der bisher bekannten Verfahren kann man ein solches 
effizientes "Knacken" ausschlieBen. Hier ist die Stegano- 
graphie eine Erganzung. Die Steganographie - Steganographie 
bedeutet urspriinglich verdecktes Schreiben - versucht, eine 
geheime Information so in einer Nachricht zu verstecken, daB 
niemand iiberhaupt Verdacht schopft, daB hier bereits eine 
geheime Nachricht versteckt ist. In diesem Fall wird auch 
der allerhochste Aufwand nichts niitzen, da ein Unbefugter 
gar nicht weiB, welche Nachricht eine geheime Nachricht 
enthalt, insbesondere wenn er eine groBe Menge von Nach- 
richt en viberwachen soil. 

In jungster Zeit besteht ein groBer Bedarf nach stegano- 
graphischen Techniken, da sich die "email" immer weiter 
ausgebreitet hat, wobei die Anwendungen nicht mehr nur im 
militarischen Bereich sind. Insbesondere besteht bei Firmen 
der Bedarf, geheimzuhaltende Geschaftszahlen elektronisch zu 
ubermitteln. Es versteht sich von selbst, daB kein Unbefug- 
ter durch Anzapfen einer Datenleitung, die beispielsweise 
ein Teil des Internets sein kann, Zugang zu solchen geheimen 
Geschaftsdaten haben soli. So existieren eine Vielzahl von 
Mail-Programmen, die einen Text vor dem Verschicken ver- 
schliisseln. Wie es jedoch bereits ausgefuhrt worden ist, 
existiert keine sichere Verschliisselung. 

Daher haben sich in jungster Zeit moderne Steganographie- 
konzepte herausgebildet . Eines dieser Steganographiekonzepte 
besteht darin, in Bilddateien das letzte Bit oder Least 
sirraifinanfc Bit von Bildpixeln fur die Speicherung der zu 
verbergenden Inf ormationen zu benutzen. Solche Verfahren 
werden ausfuhrlich von Joshua R. Smith u. a., "Modulation 
and Information Hiding in Images", First International 
Workshop, Cambridge, UK, 30. Mai bis l. Juni 199 6, Seiten 
207-225 ausfuhrlich beschrieben. Obgleich in Bildern sehr 
viele geheimen Inf ormationen versteckt werden konnen, ist an 
diesen Verfahren nachteilig, daB Bilddateien im allgemeinen 
sehr groBe Dateien sind, weshalb eine Ubertragung mittels 
elektronischer Post relativ lange dauert. AuBerdem ist ein 
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haufiges Versenden von sehr groften Dateien zwischen einem 
Ublichen Sender und einem iiblichen Empfanger relativ auf- 
fallig, was dem steganographischen Gedanken an sich zuwider 
lauft. 

Bekannte Verfahren zum Verbergen von Inf ormationen in Texten 
bestehen darin, daft bestimmte einfach vordef inierte Satz- 
strukturen erzeugt werden konnen, wobei die grammatikalische 
Zusammenstellung eines bestimmten Satzes eine ublicherweise 
binare zu verbergende Information wiederspiegelt . Diese Ver- 
fahren sind ausfuhrlich in Peter Wayner, "Disappearing 
Cryptography", Acadamic Press Inc., 1996, S. 91 - 121, 
beschrieben. Solche vordef inierten Grammatiken haben den 
Nachteil, daft sich ein Sender und ein Empfanger, wenn sie 
haufig geheime Inf ormationen kommunizieren wollen, dauernd 
Texte mit im wesentlichen gleichem Inhalt oder mit nur ge- 
ring abgewandeltem Bedeutungs inhalt schicken, woraus der 
Verdacht geschopft werden kann, daft hier geheime Inf orma- 
tionen versteckt sind . 

Bekannte Verfahren zum Verbergen von Inf ormationen in Texten 
verwenden daher entweder vordef inierte Grammatiken, die 
entweder nur einfache vordef inierte Satzstrukturen erzeugen 
konnen oder aber allein auf der Veranderung der Steuerzei- 
chen, Leerzeichen und Tabulatoren beruhen. Beide Verfahren 
sind relativ auffallig, nur sehr begrenzt einsetzbar, lie- 
f ern nur eine ger inge^BandbreiteT— d^ — h^d-ie— Menge— dea^zu- 
verbergenden Inf ormationen in einem bestimmten Text ist 
r piativ klein, und dieselben sind nicht robust gegenuber 



einfachen Veranderungen, wie z. B. durch Umf ormatieren des 
Textes oder durch leichtes Umf ormulieren. Solche Verfahren 
sind daher ebenfalls fur handschrif tliche Notizen oder Pas- 
sagen in Printmedien relativ ungeeignet, 

Insbesondere besteht ein Bedarf, iiber einen Zeitungsartikel 
geheime Inf ormationen an einen oder mehrere Empfanger zu 
verteilen. So ware es besonders auffallig, wenn an einer 
Stelle in der Zeitung auf einmal eine vordef inierte Gram- 
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matik sein wiirde, die allein aufgrund ihres Inhalts auf- 
fSllt, es sei denn, daB die Grammatik zufallig an das ak- 
tuelle Tagesgeschehen aktualisiert worden ist. 

Die Aufgabe der vorliegenden Erfindung besteht darin, ein 
verbessertes steganographisches Konzept zu schaffen, das 
flexibel einsetzbar ist und gleichzeitig ein hohes MaB an 
Unauf f alligkeit liefert. 

Diese Aufgabe wird durch eine Vorrichtung zum Verbergen von 
Informationen nach Patentanspruch 1, durch eine Vorrichtung 
zum Extrahieren von Informationen nach Patentanspruch 20, 
durch ein Verfahren zum Verbergen von Informationen nach 
Patentanspruch 25 und durch ein Verfahren zum Extrahieren 
von Informationen nach Patentanspruch 2 6 gelost. 

Der vorliegenden Erfindung liegt die Erkenntnis zugrunde, 
daB die naturlichste Nachrichtenart zum Verbergen von In- 
formationen Text ist. Das iibliche Kommunikationsmedium be- 
steht nicht im Versenden von Bildern sondern im Versenden 
von textuellen Nachrichten. Allein aus diesem Grund eignet 
sich normaler Text am besten zum Verbergen von Informatio- 
nen. GemaS der vorliegenden Erfindung wird zum Verbergen von 
Informationen in einem Text die Sprache an sich verwendet. 
Jede Sprache enthalt eine auBerordentlich groBe Redundanz . 
Daher konnen viele verschiedenen Dinge auf eine sehr groBe 
Anzahl von Arten und Weisen ausgedruckt werden. Formulie- 
rungsalternativen bestehen in verschiedenen Satzstellungen, 
verschiedenen Synonymen und verschiedenen Prapositionen etc. 
Bestimmte Satzstellungen sind aufgrund der grammatikalischen 
Regeln verboten und wiirden daher sofort auf fallen. Daher 
werden zum Verbergen von Informationen nur die Formulie- 
rungsalternativen verwendet, die (grammatikalisch und 
lexikalisch) zulassig sind. Allgemein gesagt wird ein Text 
abhangig von den zu verbergenden Informationen umf ormuliert , 
wobei die Informationen in dem umf ormulierten Text verborgen 
sind. Solche umf ormulierten Texte werden nicht auffallen, da 
sie keine kiinstlichen Elemente umfassen sondern lediglich 
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eine andere Art und Weise des AusdrUckens eines bestimmten 
Sachverhalts sind. Personen oder Programme, die eine Viel- 
zahl von Nachrichten daraufhin untersuchen, ob hier geheime 
Informationen verborgen sind, fiihren nicht immer Statistiken 
uber die ublichen Ausdrucksweisen des Verfassers. In diesem 
Fall kann man groBere Umf ormulierungsf reiheiten gestatten. 
Vermutet man, daB solche Statistiken gefiihrt werden, konnen 
noch immer automat ische Umf ormulierungen unter Einhaltung 
dieser typischen Charakteristik durchgefuhrt werden. Uber- 
wacher haben daher keine Moglichkeit, f estzustellen, ob ein 
Text bearbeitet worden ist oder nicht. Damit wird dem Kern- 
gedanken der Steganographie Geniige geleistet, der darin be- 
steht, informationen so zu verbergen, daB ein Unbefugter gar 
nicht erkennt, dafi Uberhaupt Nachrichten verborgen sind. 

Gemafi einem ersten Aspekt der vorliegenden Erfindung umfafit 
eine Vorrichtung zum Verbergen von Informationen in einem 
Text eine Einrichtung zum Lief em des Textes, eine Einrich- 
tung zum sprachlichen Analysieren des Textes, um Textbe- 
standteile und vorzugsweise ihre Zusammenhange zu anderen 
Textbestandteilen zu liefern, eine Einrichtung zum Bestimmen 
einer Mehrzahl von Formulierungsalternativen fur den Text 
durch Variieren der Reihenfolge der Textbestandteile 
und/oder durch Verwenden von Synonymen fur zumindest einen 
Textbestandteil, wobei jede Formulierungsalternative fiir den 
Text grammatikalisch richtig ist und den im wesentlichen 
g-leichen— Sinn— w-ie-der— Text-hat ,_wobei_j_ede r und/oder j edem 



Synonym bestimmte Teilinf ormationen zugeordnet sind, eine 
Einrichtung zum Auswahlen einer Formulierungsalternative aus 
der Mehrzahl von Formulierungsalternativen, derart, daB die 
Teilinf ormationen, die der ausgewahlten Formulierung zuge- 
ordnet sind, den zu verbergenden Informationen entsprechen, 
und eine Einrichtung zum Ausgeben der Formulierungsalterna- 
tiven, die einen modif izierten Text bilden, wobei in dem 
modif izierten Text die zu verbergenden Informationen verbor- 
gen sind. Diese "Teilinf ormationen" sind in einem bevorzug- 
ten Ausfuhrungsbeispiel Kompressions-Symbole, denen direkt 
binare Codes zugeordnet sein konnen. 



• ... • 





Der modifizierte Text hat somit den im wesentlichen gleichen 
Sinn wie der ursprungliche Text. Dieser Sinn ist jedoch im 
modif izierten Text anders formuliert, wobei die geheimen 
Informationen in der - grammatikalisch richtigen - Formulie- 
rung stecken . 

GemaB einem -zweiten Aspekt der vorliegenden Erf indung wird 
eine Vorrichtung zum Extrahieren von in einem modif izierten 
Text verborgenen Informationen mit einer Einrichtung zum 
Liefern des modif izierten Texts, einer Einrichtung zum 
sprachlichen Analysieren des modif izierten Texts, urn Textbe- 
standteile des modif izierten Textes zu liefern, einer Ein- 
richtung zum Liefern von Teilinf ormationen, die der Reihen- 
folge der Textbestandteile und/oder den sprachlichen Bedeu- 
tungen der Textbestandteile zugeordnet sind, wobei die 
Einrichtung zum Liefern von Teilinf ormationen die gleichen 
Teilinf ormationen liefert, die bei dem Verbergen der Infor- 
mationen, um den modif izierten Text zu erzeugen, der Rei- 
henfolge der Textbestandteile und/oder der sprachlichen 
Bedeutung der Textbestandteile zugeordnet waren, einer 
Einrichtung zum Kombinieren der Teilinf ormationen, die fur 
den modif izierten Text durch die Einrichtung zum Liefern von 
Teilinformationen geliefert werden, um die in dem modifi- 
zierten Text verborgenen Informationen zu erhalten, und 
einer Einrichtung zum Ausgeben der verborgenen Informationen 
geschaf f en. 

Anders ausqedriickt analysiert die Vorrichtung zum Extrahie- 
ren der geheimen Informationen den modif izierten Text und 
extrahiert die geheimen Informationen durch Ermitteln der 
Teilinformationen, die den einzelnen Formulierungsalterna- 
tiven zugeordnet sind. Um eine sinnvolle Extraktion zu er- 
reichen, ist es selbstverstandlich erf order lich, daft die 
Vorrichtung zum Extrahieren die Zuordnung von Teilinforma- 
tionen zu Wortstellungsalternativen, Synonymen oder Para- 
phrasen kennt, die in der Vorrichtung zum Verbergen verwen- 
det wurden. Allerdings ist es nicht erf orderlich, dafi die 
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Vorrichtung zum Extrahieren den ursprunglichen Text, der 
modifiziert worden ist, kennt, da die Teilinf ormationen 
unabhangig von einem Text den Textbestandteilen bzw. der 
Reihenfolge derselben entsprechen und nicht auf einen spezi- 
fischen Text bezogen sind, der immer aus einer Kombination 
bestimmter Textbestandteile besteht. 

Ein wesentlicher Vorteil der vorliegenden Erfindung besteht 
darin, daB jeder beliebige naturlich-sprachliche Text ver- 
wendet werden kann. Das erf indungsgemaBe Konzept ist daher 
nicht auf vordef inierte Grammatiken und ahnliches begrenzt. 
Damit entfallt das Verdacht-erzeugende Kommunizieren mittels 
im wesentlichen ahnlicher Texte. 

Ein weiterer Vorteil der vorliegenden Erfindung besteht da- 
rin, daB das erf indungsgemaBe Konzept gegenuber Textforma- 
tierungen vollig unempf indlich ist. So konnte beispielsweise 
ein modif izierter Text ausgedruckt werden oder sogar per 
Hand abgeschrieben werden und auf irgendeine Art und Weise 
zu einem Empf anger ubertragen werden, der die grammatika- 
lischen und lexikalischen Inf ormationen des Senders kennt, 
der die unter Umstanden sogar handgeschriebenen Notizen 
einfach einscannt, urn so den modif izierten Text in seine 
Vorrichtung zum Extrahieren einzuspeisen. 

Die erf indungsgemaBe Vorrichtung ist ferner gegenuber 

^^^B i-e-j-oh-^**"— Mndif ikationen des Text an sich, beispielsweise 

wenn Tippfehler korrigiert werden, einfache Artikelf ehler 
korrigiert werden, Singular/Plural-Endungen modifiziert 
werden, usw. robust. Je nach Aus fiihrungs form der erfin- 
dungsgemaBen Vorrichtung und des erf indungsgemaBen Verfah- 
rens konnen entweder die Reihenfolge von Textbestandteilen, 
Paraphrasen oder Synonyme zu Textbestandteilen, bekannte 
Verfahren oder eine beliebige Kombination all dieser Va- 
rianten verwendet werden. Wie spater ausgefuhrt, konnen 
sogar beim Komprimieren der geheimen Daten steganographische 
Verfahren anwendet werden, die mit den Verfahren der textu- 
ellen Steganographie kombiniert werden konnen: Entweder urn 
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bei Anderungen eine groBere Robustheit oder eine leichte 
Erkennbarkeit dieser Anderungen zu erreichen Oder um die 
Menge der verbergbaren Daten zu erhohen. Wird jedoch ledig- 
lich die Reihenfolge der Textbestandteile zum Verbergen von 
Informationen verwendet, so ist selbstverstandlich eine 
Umformulierung im Sinne anderer Synonyme ohne EinfluB auf 
den Erfolg der Vorrichtung zum Extrahieren. Allerdings sinkt 
hier die Bandbreite, d, h. die Menge der Informationen, die 
in dem Text verborgen werden konnen, erheblich. Somit exi- 
stiert ein KompromiS zwischen einerseits Robustheit des mo- 
dif izierten Textes gegenuber Anderungen und anderer seits 
moglicher Bandbreite, wobei dieser KompromiB je nach Benut- 
zeranf orderung gefunden werden kann. 

Bevorzugterweise sind die zu verbergenden Informationen in 
Form einer Binarsequenz gegeben. Um diese Binarsequenz in 
dem Text verbergen zu konnen, sind die Teilinf ormationen, 
die den einzelnen Alternativen zugeordnet sind, vorzugsweise 
ebenfalls Binardaten, die als Codeworter bezeichnet werden 
konnen. Daher ist zu sehen, daB generell gesagt die Vorrich- 
tung zum Verbergen von Informationen prinzipiell eine Deco- 
dierung verkorpert, wobei die geheimen Informationen in 
einen modif izierten Text decodiert werden, wobei der ur- 
sprungliche Text die Codierumstande bzw. den Codierwort- 
schatz festlegt. Analog dazu fiihrt die Vorrichtung zum 
Extrahieren der Informationen einen Codierschritt aus, wobei 
der modif izierte Text gemaB den Teilinf ormationen als "Co- 
dierwortschatz" in eine binare Sequenz codiert wird, die die 
extrahierten geheimen Informationen umfaBt. 

Hier fur konnen beliebige Codiertechniken verwendet werden, 
von denen hier lediglich beispielshaf t die Technik der 
arithmetischen Codierung und die Technik der Huffman-Co- 
dierung genannt seien. 



Bevorzugte Ausf iihrungsbeispiele der vorliegenden Erfindung 
werden nachfolgend bezugnehmend auf die beigefugten Zeich- 
nungen detailliert beschrieben. Es zeigen: 
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ein schematisches Blockdiagramm einer erfindungs- 
gemaBen Vorrichtung zum Verbergen; 

ein schematisches Blockdiagramm einer erfindungs- 
gemaSen Vorrichtung zum Extrahieren; 

ein Ablaufdiagramm zur Alternativengenerierung fur 
eine Phrase gemaB einem bevorzugten Ausf uhrungsbei- 
spiel der vorliegenden Erfindung; und 

ein Ablaufdiagramm zur Veranschaulichung der Be- 
handlung einzelner Alternativen gemaB der vorlie- 
genden Erfindung, 

Fig. 1 zeigt ein Blockdiagramm einer erf indungsgemaBen Vor- 
richtung 10 zum Verbergen von Inf ormationen in einem Text, 
der iiber einen Texteingang 12, d. h. eine Einrichtung zum 
Liefern des Textes, zugefuhrt wird. Die Vorrichtung 10 zum 
Verbergen von Inf ormationen umfaBt ferner einen weiteren 
Eingang 14 fur die zu verbergenden Inf ormationen sowie einen 
Ausgang 16 fur einen modif izierten Text, der sinngemaB dem 
ursprunglichen Text entspricht, in dem jedoch die zu verber- 
genden Inf ormationen enthalten sind. 

^^^^k Die Vorrichtung 10 zum Verbergen von Inf ormationen umfaBt 

^^^B ferner— eine— Einrichtung— 1-8— zum-spracha-ichen_Analy-sieren„d.es_ 

Textes, urn Textbestandteile zu liefern. Diese Textbestand- 
tPiiP knnnen einer Einrichtung 20 zum Bestimmen einer Mehr- 
zahl von Formulierungsalternativen fur den Text zugefuhrt 
werden. Eine Einrichtung 22 zum Auswahlen einer Formulie- 
rungsalternative aus der Mehrzahl von Formulierungsalterna- 
tiven ist angeordnet, urn die Formulierungsalternative aus- 
zuwahlen, deren Teilinf ormationen den zu verbergenden 
Inf ormationen entspricht. Der Einrichtung 2 2 zum Auswahlen 
einer Formulierungsalternative ist eine Einrichtung 24 zum 
Ausgeben der Formulierungsalternative, die den modif izierten 
Text bildet, nachgeschaltet , um den modif izierten Text an 



Fig. 1 



Fig. 2 



Fig. 3 



Fig. 4 
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dem Ausgang 16 auszugeben. 

Im nachfolgenden wird auf die einzelnen Elemente der Vor- 
richtung 10 zum Verbergen von Inf ormationen in einem Text 
eingegangen. 

Die Einrichtung 18 zum Analysieren des Textes, um Textbe- 
standteile zu liefern, ist angeordnet, um ein sogenanntes 
"Parsing"-Verfahren durchzuf tthren. Vorzugsweise ist die 
Einrichtung 18 zum sprachlichen Analysieren des Textes ein 
sogenannter HPSG-Parser (HPSG = Head-driven Phrase Structure 
Grammar) . Das Standardwerk zu dessen Realisierung ist 
Pollard and Sag: "Head driven Phrase Structure Grammar", 
University of Chicago Press, 1994. Neben dem HPSG-Parser 
sind in der Technik viele andere Parser bekannt, die eben- 
falls bei der vorliegenden Erfindung zum Einsatz kommen 
konnen. Insbesondere HPSG-Parser sind moderne hochlexikali- 
sierte unif ikationsbasierte Parser- Vorzugsweise arbeiten 
solche Einrichtungen satzweise. Allgemein gesagt wird, wie 
es spater erlautert wird, der Text in seine linguistischen 
Textbestandteile zerlegt, wobei zunachst der Kopf des Sat- 
zes, der ublicherweise das Verb ist, ermittelt wird, um 
anschliefiend andere Konstituenten des Satzes, etwa ein Sub- 
jekt, Komplemente und Adjunkte, zu bestimmen. Die grofiten 
Vorteile eines unif ikationsbasierten Parsers fur HPSG ge- 
genuber anderen Parsern sind, daB (a) die gleichen Spezi- 
fikationen fur Analyse (eines Ausgangssatzes) und Generation 
(der umformulierten Satze) verwendet werden (b) es nur etwa 
^•in nnt.?end Parsereqeln pro Sprache gibt - alles andere ist 
deklarativ spezifiziert im Lexikon, erfordert wenig Program- 
mieraufwand und laBt sich leicht auf andere Sprachen uber- 
tragen (c) Inf ormationen von verschiedenen linguistischen 
Ebenen / Bereichen (Syntax, Semantik, Pragmatik) leicht 
kombiniert werden konnen, Hieraus ergibt sich die sehr enge 
Kopplung zwischen Parser und einem inhaltlich reichhaltigen 
Lexikon, vorzugsweise basierend auf dem Formalismus der ge- 
typten Merkmalstrukturen. Ein solcher Parser liefert die 
syntaktische oder sogar die semantische Struktur eines 



- 11 - 





Satzes als Baum oder Graphstruktur . Bzgl. der satzstellung 
zusammengehorige Worter werden als solche identif iziert . 
Informationen zur Konstituenten-Reihenf olge (also der Satz- 
stellung) konnen direkt fur Kopfeintrage zusammen mit se- 
mantischen Informationen lexikalisch spez if iziert sein, 
insbesondere bei Verben. Dies dient dazu, sehr fruhzeitig 
viele Pars inga Iter nativen auszuschlieBen . Parsingalterna- 
tiven mussen ausgeschlossen werden, die Formulierungsalter- 
nativen ergeben, die grammatikalisch falsch sind. Ferner ist 
es fur das steganographische Konzept der vorliegenden Erfin- 
dung entscheidend, daB der modifizierte Text den im wesent- 
lichen gleichen Sinn wie der ursprungliche Text hat. 

Stefan Muller: "Scrambling in German - Extraction into the 
mittelfeld". Proceedings of the tenth Pacific Asia Con- 
ference on Language, Information and Computation, City 
University of Hong Kong, 1995 beschreibt, wie man furs 
Deutsche Regeln bzw. Constraints zur Wortstellung in 
HPSG-Systemen abieitet. Gregor Erbach: "Ambiguity and 
linguistic preferences" in "H. Trost (ed.): Feature 
Formalisms and Linguistic Ambiguity", Ellis-Horwood, 1993 
beschreibt, wie man solchen Wortstellungsalternativen so 
Wahrscheinlichkeiten zuordnen kann, daB sie dem realen 
Sprachgebrauch sehr nahe kommen. 

Ein HPSG-Parser ist ein Spezialfall eines unif ikations- 

basierten— Parsers-^ der mi-t- — getypten Merkmalstrukturen_ 

arbeitet. Ein HPSG-Parser benotigt zwingend Lexikon- und 
■Grammatik-JKomponenten zum Arbeiten, Lexika und Grammatik 
bilden eine Einheit, auBerdem gibt es einige wenige Regeln, 
in HPSG "Schemata", "Prinzipien" , "lexikalische Regeln" 
genannt. Auch andere Parser, die nur Regeln benotigen, oder 
die nicht mit getypten Merkmalstrukturen, sondern mit fast 
beliebigen anderen Datenstrukturen arbeiten, und/ oder die 
Statistiken beriicksichtigen konnen oder nicht, konnen fur 
die vorliegende Erfindung eingesetzt werden. 



Die Einrichtung 2 0 zum Bestimmen einer Mehrzahl von For- 
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mulierungsalternativen fur den Text kann eng mit dem HPSG- 
Parser gekoppelt sein. Vorzugsweise besteht die Einrichtung 
20 aus zwei Teilkomponenten : Erstens einer Lexikon/Gram- 
matik-Stufe und zweitens einer Komponente zur Generierung 
der moglichen Satzstellungs- und Formulierungsalternativen 
aus einer Menge von Regeln oder Constraints, die zuvor durch 
Lexikonzugriff und/oder Parsing ermittelt wurden. Ersetzun- 
gen durch aquivalente Phrasen konnen relativ einfach durch 
Zugriff auf ein Synonymlexikon vorgenommen werden, und Texte 
konnen aufgrund der kopfgesteuerten Vorgehensweise sehr 
effizient komprimiert werden: Die Vorhersagbarkeit fur die 
nachsten zu komprimierenden Daten ist so sehr hoch. Beim 
Ersetzen der Synonyme gibt es zwei gangige Alternativen: 
Entweder man benutzt ein Vollf ormenlexikon, das alle 
gangigen flektierten Formen enthalt. Beispiel: "lauft" ist 
synonym zu "gent". In einer anderen Variante sind nur 
Grundformen gleichgesetzt . Beispiel: "laufen" ist synonym zu 
"gehen" . Hier wird zusatzlich eine morphologische Komponente 
benotigt, die im Beispiel "lauft" analysiert als "3. Person 
Singular von laufen", und aus "3. Person Singular von gehen" 
"geht" generiert. Losungen hierzu sind in der Technik 
wohlbekannt als regelbasierte Morphologie, Zwei-Ebenen- 
Morphologie oder Morphologie mit endlichen Zustandsmengen . 

GemaS der vorliegenden Erfindung dient die Einrichtung 20 
zum Bestimmen einer Mehrzahl von Formulierungsalternativen 
dazu, Moglichkeiten fur den modif izierten Text zu schaffen. 
Dies kann insbesondere durch Variieren der Reihenfolge der 
Tovt-hact-anrti-Pile und/oder durch Verwenden von Synonymen fur 
die Textbestandteile erreicht werden. Im Sinne dieser Erfin- 
dung ist ein Synonym nicht nur als Synonym fur ein einzelnes 
Wort sondern auch als Paraphrase, also Synonym fur einen 
Textbestandteil, d. h. eine Gruppe mit mindestens einem 
Wort, aufzufassen. Hat ein Textbestandteil mehrere Worte, so 
kann eine Paraphrase fur diesen Textbestandteil weniger oder 
mehr Worte aufweisen, jedoch unter der Einschrankung, dali 
der Sinn des Textbestandteils nicht wesentlich verandert 
wird. Das Mafi der Ahnlichkeit bzw. der Abweichung la6t sich 
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leicht beurteilen, wenn Worter semantischen Konzepten in 
einer semantischen Hierarchie (also einer Ontologie) zuge- 
ordnet sind und Knoten mit Gewichten und Kanten mit dem Grad 
der Ahnlichkeit der verbundenen Knoten gekennzeichnet sind. 

Eine einfache Formulierungsalternative eines Satzes besteht 
darin, daS lediglich die Reihenfolge der Textbestandteile 
geandert wird. Bei den meisten Satzen erlaubt die Grammatik 
mehrere verschiedene Satzstellungen. Jeder Satzstellung wird 
eine eindeutige Teilinf ormation zugeordnet: In bevorzugten 
Ausfiihrung handelt es sich hierbei urn Symbolcodes - wie 
schon im Abschnitt der Synonyme ausgefiihrt. Ein Ansatz ist 
es von der sogenannten kanonischen Reihenfolge oder Normal- 
Reihenfolge auszugehen. So konnte in der kanonischen Reihen- 
folge zunachst das Subjekt kommen, dem das Verb folgt, dem 
wiederum ein Adverb folgt, dem wiederum weitere eventuell 
noch vorhandene Satzbestandteile nachgeordnet sind. Ein 
Beispiel ist das Englische: Die hier geltende Satzstellungs- 
regel "Subjekt - Pradikat - Objekt" konnte eine der kanoni- 
sierenden Regeln fur andere Sprachen wie das Deutsche sein. 
Jede andere Satzstellung konnte dann als x-te Permutation 
dieser kanonischen Reihenfolge kodiert werden. Dieses Kon- 
zept der kanonischen Reihenfolge lafit sich verallgemeinern: 
Es reicht, jeder Satzstellung immer wieder den gleichen Code 
zuordnen zu konnen - egal in welcher Satzstellung sich der 
Eingabesatz befindet. Dazu mu3 die kanonische Reihenfolge 
— ^^^V nicht— generiert— werdem — Vielmehr— reicht^es-,— wenn— die— Inf orig- 
ination benutzt wird, mit deren Hilfe grundsatzlich diese 
kanonische Reihenfolge erzeugt werden kann. In einer bei- 
spielhaften Realisierung konnte dies ein Regelsystem sein: 
In jeder Situation werden alle sich ergebenden Zustande nach 
Regelanwendung gleichartig durchnumeriert . Der Code fur die 
gesamte Satzstellung konnte sich durch Konkatenation der so 
fur jeden Schritt der Regelanwendung ergebenden Codes ent- 
stehen. Diese Konkatenation kann wiederum nach alien aus der 
Datenkompression bekannten Varianten erstellt werden: Durch 
arithmetische, bitweise, byteweise, wortweise Verkettungen - 
moglicherweise mit Elimination von Redundanzen. 
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Bei einem bevorzugten Ausf uhrungsbeispiel der vorliegenden 
Erfindung, das nicht nur auf ein Variieren der Reihenfolge 
der Textbestandteile aufbaut, sondern ebenfalls Synonyme 
verwendet, .kann die Einrichtung zum Bestimmen einer Mehrzahl 
von Formulierungsalternativen auf die Lexikon/Grammatik- 
Stufe zugreifen, ura fiir ein Wort gleichbedeutende Synonyme 
zu ermitteln. Jedem dieser Synoyme sind ebenfalls eindeutige 
Teilinformationen zugeordnet, durch die das Synonym von ei- 
nem anderen Synonym eindeutig unterschieden werden kann. In 
einer bevorzugten Ausfiihrung sind diese Teilinformationen 
Symbole im Sinne der Datenkompression, denen direkt im Lexi- 
kon Bitcodes (Huffman Codierung) oder Wahrscheinlichkeits- 
intervalle (Arithmetische Codierung) zugeordnet sind oder 
zugeordnet werden konnen. 

Vorzugsweise ist die Einrichtung 18 zum sprachlichen Ana- 
lysieren angeordnet, um keine Textbestandteile zu liefern, 
ftir die die Korrektheit der Umf ormulierung nicht garantiert 
werden kann. Ferner ist die Einrichtung 20 zum Bestimmen von 
Formulierungsalternativen angeordnet, um nur solche Formu- 
lierungsalternativen anzubieten, fur die sichergestellt ist, 
daB bei deren Analyse wieder der gleiche Satz von Formulie- 
rungsalternativen erhalten werden kann. Wird beispielsweise 
das Wort "Mutter" im zu modif izierenden Text betrachtet, so 
konnte es eine leibliche Mutter oder eine Schrauben-Mutter 
bezeichnen. Falls der Kontext nicht eindeutig z. B. der 
Maschinenbau ist, wurde die Einrichtung zum sprachlichen 
Analvsieren bei diesem Ausf uhrungsbeispiel den Textbestand- 
teil "Mutter" uberhaupt nicht liefern und darauf verzichten, 
in ein Synonym zu "Mutter" zu verbergende Inf ormationen zu 
verstecken. Analog dazu wurde die Einrichtung 2 0 zum Be- 
stimmen der Mehrzahl von Formulierungsalternativen "Mutter" 
nicht a Is Synonym fUr einen Textbestandteil anbieten, falls 
der Kontext nicht eindeutig ist. 



Die Flexibilitat des Konzepts gemaft der vorliegenden Erfin- 
dung kann an die spezif ischen Benutzeranf orderungen beliebig 
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angepaBt werden, indem die Einrichtung 20 zum Bestimmen 
einer Mehrzahl von Formulierungsalternativen eine bestimmte 
Anzahl von Synonymgruppen umfaBt. Wird die Anzahl der Sy- 
nonymgruppen erhoht, so kann in einem gegebenen Text eine 
groBere Menge von Geheiminformationen verborgen werden. Da 
im Gegensatz zum Stand der Technik das Konzept der vorlie- 
genden Erfindung auf beliebige Texte anwendbar ist, muBte 
zum Erreichen einer maximalen Menge von zu verbergenden 
Informationen in einer begrenzten Menge an Text die Ein- 
richtung 2 0 zum Erzeugen von Formulierungsalternativen fur 
jedes beliebige Wort eine entsprechende Anzahl von Synonymen 
bereitstellen konnen. Da jedoch die Anzahl der moglichen 
Worter in einer Sprache sehr groB werden kann, ist es 
unwahrscheinlich, daB die Einrichtung 20 zum Bestimmen einer 
Mehrzahl von Formulierungsalternativen fur jedes beliebige 
Wort Synonyme erzeugen kann bzw. gespeichert hat. Trifft 
dieselbe auf ein Wort, fur das es keine Synonyme hat, so 
wird sie dieses Wort einfach unverandert lassen. Die 
Einrichtung 20 kann dann selbstver standi ich auch keine 
Teilinformationen bestimmen, da keine Teilinf ormationen fur 
dieses Wort vorhanden sind. Daher wird dieses Wort nicht 
dazu verwendet werden konnen, zu verbergende Informationen 
"auf zunehmen" . Untersuchungen haben jedoch gezeigt, daB die 
Anzahl der tatsachlich verwendeten Worter im groBen und 
ganzen relativ begrenzt ist, weshalb bei durchschnittlichen 
Texten, wie sie beispielsweise zum Ubermitteln von 
— Gescnaftsdaten- — eingeset-zt — werden-, in — begrenztem — Aufwand 



Synonyme fur nahezu alle dort auftretenden Worte lieferbar 
sind. Hier liegt gerade eine Starke der vorliegenden 
Erfindung, derart, daB durch weiteres Aufnehmen von 
Synonymgruppen in die Einrichtung zum Bestimmen von 
Formulierungsalternativen die erf indungsgemaBe Vorrichtung 
beliebig "auf gerustet" werden kann und somit je nach Anwen- 
dungsgebiet und Marktbedurf nissen maBgeschneidert werden 
kann. Weiterhin kann man komplette Synonymworterbucher li- 
zenzieren und es sind auch eine Reihe von Verfahren bekannt, 
wie man Synonyme automatisch aus einer groBen Sammlung von 
Texten lernt . 




Die Einrichtung 2 2 zum Auswahlen einer Formulierungsalter- 
native aus der Mehrzahl von Formulierungsalternativen, 
derart, daB die Teilinf ormationen, die der ausgewahlten 
Formulierung zugeordnet sind, den zu verbergenden Informa- 
tionen entsprechen, arbeitet allgemein gesprochen wie ein 
Decodierer oder Dekomprimierer. 

Der "Wortschatz" fur das Dekomprimieren der zu verbergenden 
Informationen, d. h. die zu verbergenden Inf ormationen haben 
ublicherweise eine hohere Inf ormationsdichte als der modifi- 
zierte Text- Hinzu kommt, daB Synonyme in Gruppen von mog- 
lichst vielen Wortern mit untereinander gleicher oder ahnli- 
cher Bedeutung - Synonyminengen - angeordnet werden, so daB 
die Auswahl eines Synonyms einen moglichst hohen Informati- 
onsgehalt darstellt. 

Diese Auswahl der Alternativen wird durch die Einrichtung 2 2 
zum Auswahlen durchgefuhrt und wird durch die Einrichtung 2 0 
zum Bestimmen einer Mehrzahl von Formulierungsalternativen 
fur den Text bereitgestellt , wobei der Wortschatz gemaB der 
vorliegenden Erfindung grundsatzlich durch den Ausgangstext , 
d. h. den am Eingang 12 zugefiihrten Text, bestimmt wird, 
derart, daB im Gegensatz zum Stand der Technik, der ledig- 
lich einfache vordef inierte Grammatikstrukturen verwendet, 
beliebige Texte zum Verbergen von Informationen genommen 
werden konnen. In einer bevorzugten Variante bestimmt sich 
der Wortschatz fur die Umf ormulierung exakt aus der Menge 
c\e>r .^ynnnynifi fur die Worte im Ausgangstext, Eine wes entliche 
Eigenschaft ist die Reflexivitat der Synonym-Relation: 1st x 
synonym zu y, so ist auch umgekehrt y synonym zu x. 

Bei einem bevorzugten Ausf tihrungsbeispiel der vorliegenden 
Erfindung arbeitet die Einrichtung 2 2 als arithmetischer 
Decodierer oder Dekompressor , wahrend dieselbe bei einem 
anderen bevorzugten Ausfuhrungsbeispiel der vorliegenden 
Erfindung als bitbasierter Decodierer bzw. Dekompressor 
arbeitet. In diesem Fall werden zu verbergende Informationen 
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als Binardaten behandelt. Wenn die zu verbergenden Infor- 
mationen Textdaten, d. h. Buchstaben oder Zahlen, sind, wer- 
den dieselben vorzugsweise mittels eines ublichen Kompri- 
mierungsprogrammes komprimiert, wobei solche in der Technik 
bekannten Komprimierer bereits Bitdaten ausgeben. 

Im Falle der arithmetischen Ausfiihrung werden die zur Ver- 
fUgung stehenden Alternativen, die von der Einrichtung 2 0 
zur Ver f ugung gestellt werden , als "Kontext" bezeichnet , 
wahrend dieselben im Falle einer bitbasierten Ausfiihrung als 
"Worterbuch" behandelt werden. Diese Begriffe sind in der 
Literatur liblich. Gemeinsam ist beiden, daB sie aus Paaren 
bestehen, die auf Syrabol-Wahrscheinlichkeitspaaren beruhen. 
Im Falle der bitbasierten Kodierung werden die Wahrschein- 
lichkeiten p durch Codes der Lange des negativen Zweierloga- 
rithmus von p "-ld(p)" - jeweils gerundet - dargestellt. 

Damit beliebige zu verbergende Inf ormationen verarbeitet 
werden konnen, derart, daB sie eine giiltige Formulierungs- 
alternative ergeben, miissen die Teilinf ormationen, die den 
Wortstellungsreihenfolgen und/oder den Synonymen zugeordnet 
sind, eine bestimmte Bedingung erfiillen. Bei einer bitba- 
sierten Ausfiihrung lautet die Bedingung derart, daB, falls 
fur die Lange l f der i-ten Alternative als eine von n 
gleichzeitig moglichen Alternativen zu jedem Zeitpunkt fol- 
gende Bedingung erfiillt ist: 



n 

s 2" 1 !- = 1,0 
i=l 

Bei einer Ausfiihrung mittels arithmetischer Codierung/Deco- 
dierung muB die Gesamtsumme der Gewichte aller Alternativen 
bekannt sein, damit die Gewichte zu Wahrscheinlichkeiten 
zuruckgerechnet werden konnen, die sich zu Eins aufsummie- 
ren. 

Bezuglich der arithmetischen Codierung/Decodierung und der 
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bitbasierten Codierung, deren prominentester Vertreter das 
Huf fman-Codieren ist, exist iert eine groBe Menge an Li- 
teratur. Beispielhaft sei hier "Managing Gigabytes" von 
Witten, Moffat und Bell, Van Nostrand Reinhold, New York, 
1994, genannt. Anschauliche Beispiele und Inf ormationen 
finden sich ebenfalls in "The Data Compression Book", von 
Nelson und Gailly, M & T Books. 

Zum Verstandnis der vorliegenden Erfindung sei jedoch auf 
den Grundgedanken der arithmetischen Codierung/Decodierung 
eingegangen. Im Gegensatz zur Huf fman-Codierung erlaubt die 
arithmetische Codierung eine beliebige Anpassung an die in 
einem Text vorliegende Entropie, wahrend bei der Huf fman- 
Codierung zumindest ein Bit pro Symbol vergeben werden muB. 

Die meisten Datenkompressionsverf ahren passen wahrend des 
Komprimierens laufend interne Stat ist iken an, urn die zu 
erwartenden Daten moglichst exakt abschatzen zu konnen. 
Hierzu wird jedem Bestandteil ein Bereich oder eine Gewich- 
tung zugewiesen, dessen Breite der Wahrscheinlichkeit ent- 
spricht. Bei- allgemeinen Codierverf ahren muB die Gesamtwahr- 
scheinlichkeit kleiner oder gleich 1,0 sein. Fur die hier 
beschriebenen steganographischen Codierverf ahren muB jedoch 
zwingend gelten, daB alle Wahrscheinlichkeiten/Gewichtungs- 
bereiche zusammen 1,0 ergeben. Dann wird mit der Codierung 
begonnen. Die Starke der arithmetischen Codierung besteht 
gerade darin, daB ein zu codierendes Symbol auch Bruchteile 
einer Nachkommas telle - sprich eines Bits - belegen kann. 
Der aktuelle Codiererzustand wird durch die GroBe eines 
aktuellen Intervalls reprasentiert . Bei der Codierung wei- 
terer Zeichen wird dieses Interval 1 immer weiter eingeengt 
wie bei einer Intervallschachtelung. Allgemein gesprochen 
wird daher eine einzige Mantisse einer FlieBkommazahl er- 
zeugt, die eine codierte bzw. komprimierte Version der zu 
codierenden Eingangsdaten darstellt. 

Im Decodierer wird wiederum der umgekehrte Vorgang durchge- 
fuhrt. Die Einrichtung 22 zum Auswahlen einer Formulierungs- 
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alternative aus der Mehrzahl von Formulierungsalternativen 
beginnt mit einem Intervall von 0 bis 1, d. h. dem groBt- 
moglichen Anfangs intervall . Die zu verbergenden Informa- 
tionen werden dabei, wie es bereits erwahnt wurde, als 
einzige Mantisse einer FlieBkommazahl betrachtet. Von den 
Bits dieser Mantisse werden vom Anfang her jeweils soviele 
Bits betrachtet, bis die Zahl, die diese Bits darstellen, 
eindeutig in einem der Wahrscheinlichkeitsintervalle liegt, 
die durch die Teilinf ormationen, die durch die Einrichtung 
20 zum Bestimmen einer Mehrzahl von Formulierungsalterna- 
tiven bestimmt werden, definiert sind. Die ausgewahlte Al- 
ternative hat somit ein zugeordnetes fest definiertes Inter- 
vall. Dieses Intervall wird anschaulich gesprochen - aller- 
dings erst nach evtl. mehreren Schritten - wieder auf die 
Breite 1 skaliert. Damit konnen die weiteren Bits aus dem 
Datenstrom der zu verbergenden Inf ormationen wieder eine der 
Alternativen wahlen, deren Wahrscheinlichkeiten sich zu 1 
summieren. In der Praxis werden die Wahrscheinlichkeits- 
alternativen als ganzzahlige Werte, die Vielfache der 
eigentlichen Wahrscheinlichkeiten sind, verwaltet, wobei das 
Intervall nicht nach jedem Decodierungsschritt neu skaliert 
werden muB. Vielmehr werden die Intervallgrenzen so lange in 
einer Art Interval lschachtelung verkleinert, bis die Genau- 
igkeit nicht mehr gewahrleistet ist und neu skaliert werden 

— Zum— Zw^kc* hot- ansnhaulichkei t wird im Folgenden von Code- 
baumen im Zusammenhang mit der Huf fman-Codierung gesprochen. 
Tatsachlich wurde man dies nicht als Baum sondern als Tabel- 
le von praf ix-freien Codes realisieren, wie dies aus aer 
kanonischen Huf fman-Codierung bekannt ist. Dies ermoglicht 
eine hohere Geschwindigkeit bei weniger Speicherverbrauch. 
Ein solcher "Codebaum" ist als Teil eines Worterbuchs fur 
die bitbasierte Codierung anzusehen. Ein worterbuch enthalt 
daruber hinaus auch die Zuordnung der Symbole zu den Codes 
des "Kontextes" oder "Baumes" . Praziser ist es, von Kontex- 
ten statt von Worterbuchern und von tabellenf ormigen Kontex- 
ten statt von Baumen zu sprechen. 
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Bei einem anderen Ausf uhrungsbei spiel der vorliegenden Er- 
findung wird statt der arithmetischen Codierung/Decodierung 
eine bitbasierte Codierung und insbesondere eine Huffman- 
Codierung verwendet. Wie es bekannt 1st, kann ein einfacher 
Huffman-Code mittels einer Liste von Symbolen / Token und 
zugeordneten Haufigkeiten oder Wahrscheinlichkeiten erzeugt 
werden. Wenn jeder Zweig des Baums mit einem gultigen Huff- 
man-Codewort abgeschlossen ist, konnen beliebige Informa- 
tionen codiert/decodiert werden, sofern sie sich mit den im 
Codebaum gespeicherten Symbolen darstellen lassen. Diese 
Bedingung wurde bereits weiter vorne allgemein ausgefuhrt. 
Im Falle der Huf fman-Codierung, die weiter hinten anhand 
eines Beispiels detaillierter erlautert ist, sind die 
Teilinformationen, die den einzelnen Formul ierungsa 1 terna- 
tiven, d. h. den Reihenfolgen der Textbestandteile und/oder 
den einzelnen Synonymen fur die Textbestandteile zugeordnet 
sind, Huf f man-Codeworter . Bei einem ublichen Huffman-Code 
wird zunachst der zu codierende Text statistisch analysiert, 
wobei das haufigste Zeichen in einem Text tiblicherweise das 
Leerzeichen oder der Buchstabe "e" ist, Zeichen, die haufig 
vorkommen, werden moglichst kurze Codeworter zugeordnet, 
wahrend Zeichen, die sehr selten vorkommen, eher langere 
Codeworter zugeordnet werden, jedoch unter der Vorausset- 
zung, daB ein vollstandiger Codebaum entsteht. Damit wird, 
wie es fur Huffman-Codes bekannt ist, eine moglichst groSe 
Datenkompression erreicht. 

Allen verschiedenen grammat ikalisch mogl ichen Reihenfolgen 
von Textbestandteilen wird somit ein Huf fman-Codewort zuge- 
ordnet, derart, daB die Huf f man-Codeworter fur die Reihen- 
folgen der Textbestandteile einen vollstandigen Codebaum 
ergeben. Dasselbe trifft fur die einzelnen Synonymsatze zu. 
So miissen die Teilinformationen, d. h. die Huf f man-Code- 
worter, die einem Textbestandteil und den Synonymen zu 
diesem Textbestandteil zugeordnet sind, insgesamt einen 
gultigen Codebaum ergeben. 
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Wie es bereits ausgefUhrt worden ist, fuhrt die Einrichtung 
2 2 zum Auswahlen einer Formulierungsalternative aus der 
Mehrzahl von Formulierungsalternativen eine Huf fman-Decodie- 
rung durch. Sie erhalt als Eingangssignal die zu verbergen- 
den Inf ormationen und bewegt sich in einem Code-Kontext , der 
durch die Einrichtung 20 zum Bestimmen einer Mehrzahl von 
Formulierungsalternativen bereitgestellt wird, gemaB der 
Bitsequenz der zu verbergenden Inf ormationen soweit vor, bis 
ein giiltiges Codewort gefunden worden ist. Daraufhin wahlt 
die Einrichtung 22 diese Formulierungsalternative, wie bei- 
spielsweise eine bestimmte Wortstellungsreihenf olge. An- 
schlieBend kann dann der Synonym-Code-Kontext fur Kopf, 
Subjekt, Komplemente, Adjunkte des Satzes verwendet werden. 
Allerdings ist zu beachten, daB die Ersetzung der Synonyme 
im Prinzip nur von der semantischen Kategorie und der 
Kontextinformation und nicht von der Wortfunktion (Subjekt, 
Kopf, Komplement, etc.) abhangt. Es kann deshalb mit der 
Ersetzung durch Synonyme in der Reihenfolge der Worter im 
umgestellten Satz ausgegangen werden. Allerdings lassen sich 
aus der Wortfunktion haufig morphologische KenngroBen naher 
eingrenzen, z. B. der Fall. Hierzu werden wieder die zu 
verbergenden Inf ormationen bitweise dazu dienen, nacheinan- 
der in den jeweiligen Code-Kontexten fur die Synonyme soweit 
fortzuschreiten, bis ein gultiges Codewort gefunden worden 
ist. Dieses Verfahren wird bei einem bevorzugten Ausfuh- 
rungsbeispiel der vorliegenden Erfindung fortgesetzt, bis 
-e-±n— Satz— Oder— im—grSBeren^ 
ist. Die zu verbergenden Inf ormationen wurden dabei als eine 

FtllffP van Hu£f ma n -Codew.or_ten aufgefaBt, die mittels ver- 

schiedener, durch die Einrichtung 2 0 und letztendlich durch 
den ursprunglichen Text bestimmten Code-Kontexte in einen 
modif izierten Text umgewandelt, d. h. decodiert, worden 
sind, der dann ausgegeben wird. 



In einer bevorzugten Ausfiihrung wird zunachst die neue 
Wortstellung im Datenstrom codiert, worauf dann die Codes 
fur die Ersetzung der Synonyme folgen. 
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Die Einrichtung zum Bestixtunen der Mehrzahl von Formulie- 
rungsalternativen kann angeordnet sein, um immer nur die 
eine Formulierungsalternative zu ermitteln, die durch die 
Einrichtung zum Auswahlen aufgrund der zu verbergenden 
Informationen ausgewahlt wird. Beispielhaft anhand eines 
Codebaums ausgedriickt ist es nicht notwendig, daB samtliche 
Zweige verfolgt werden, sondern an einem Knoten nur immer 
der Zweig, der schlieBlich zu dem Codewort fiihrt. 

Bevor ein detailliertes Beispiel fur die Funktionsweise der 
Vorrichtung 10 zum Verbergen von Informationen gegeben wird, 
sei auf Fig. 2 eingegangen, die ein schematisches Block - 
schaltbild einer Vorrichtung 50 zum Extrahieren von in einem 
modif izierten Text verborgenen Informationen darstellt. Der 
modif izierte Text wird iiber einen Eingang 52 in die Vorrich- 
tung 50 eingespeist- Die extrahierten Informationen werden 
iiber einen Ausgang 54 ausgegeben. Die Vorrichtung 50 umfaBt 
wiederum eine Einrichtung 56 zur sprachlichen Analyse des 
modif izierten Textes, um die Textbestandteile des modif i- 
zierten Textes zu liefern. Aufgrund dieser Informationen 
werden die Codes fur die Wortstellung zugeordnet. Die 
Textbestandteile werden in eine Einrichtung 58 zum Liefern 
von Teilinf ormationen eingespeist, um die Teilinf ormationen 
zu ermitteln, die den Textbestandteilen und/oder der Rei- 
henfolge der Textbestandteile zugeordnet sind. Dazu muB die 
Einrichtung 58 zumindest fiir die durch die Analyse 56 
bestimmten Textbestandteile durch die Einrichtung 10 zum 
Verbergen (Fig. 1) festgelegten Teilinf ormationen ermitteln 
konnen. Vorzugsweise enthalt die Einrichtung 58 daher ebenso 



wie die Einrichtung 2 0 der Vorrichtung zum Verbergen die 
Lexikon/Grammatik-Stuf e, die Textbestandteilreihenf olge und 
zugeordnete Teilinf ormationen sowie Synonyme und zugeordnete 
Teilinf ormationen liefern kann. Die vorzugsweise bitformigen 
Teilinf ormationen, die auf Wahrscheinlichkeiten zuruckfiihr- 
bar sind und die dem modif izierten Text zugeordnet sind, 
werden einer Einrichtung 60 zum Kombinieren der Teilin- 
formationen, um die in dem modif izierten Text verborgenen 
Informationen zu erhalten, zugefuhrt. Je nach Implementation 
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der Vorrichtung zum Verbergen wird die Einrichtung 60 zum 
Kombinieren der Teilinf ormationen entweder als arithmeti- 
scher Codierer oder als Huf fman-Codierer Oder als sonstiger 
Codierer abhangig von der Codiertechnik der Vorrichtung 10 
ausgefuhrt sein. Die kombinierten Teilinf ormationen werden 
schlieBlich einer Einrichtung 62 zum Ausgeben der verbor- 
genen Inf ormationen zugeftihrt, damit sie an dem Ausgang 54 
ausgegeben werden konnen. Die Ausgabevorrichtung enthalt 
vorzugsweise, wenn die zu verbergenden Inf ormationen kom- 
primierte Textdaten sind, eine Dekomprimiervorrichtung, 
derart, daB aus der Vorrichtung 50 zum Extrahieren keine 
Bitdaten sondern beispielsweise Textdaten ausgegeben werden. 

Im nachfolgenden wird die Funktionsweise der Vorrichtung 10 
zum Verbergen von Inf ormationen bei einer Implementation 
mittels Huf fman-Codierung/Decodierung in der Auswahlein- 
richtung 2 2 bzw. der Kombinationseinrichtung 60 in der 
Vorrichtung 50 zum Extrahieren dargestellt. Der Beispielsatz 
lautet: 

"Das Auto fahrt schnell bei glatter StraBe uber den Hugel." 

Die Einrichtung zum sprachlichen Analysieren 18 wird diesen 
Satz in folgende Teilphrasen zerlegen: 

1: Das Auto, 

^^^m 2z f'SHrC; 

3: schnell, 

4: bei cylatter StraBe, 

5: viber den Hiigel. 

Es sei darauf hingewiesen, da3 der Beispielsatz bereits in 
der sogenannten kanonischen Reihenfolge (d. h. Subjekt, 
Verb, Adverb, Prapositionaladjunkte , . . . ) vorliegt. Die 
Ziffern vor den Satzbestandteilen konnen nun zur Kurz- 
darstellung der Wortstellungsalternativen verwendet werden. 
So steht beispielsweise "42135" fur den Satz: 
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"Bei glatter StraBe fahrt das Auto schnell iiber den Hugel." 




Diese alternative Wortstellung ist eine von der Einrichtung 
2 0 zuia Bestimmen von Formulierungsalternativen erzeugte 
Wortstellung, die sich von der ursprtinglichen Wortstellung 
unterscheidet, die jedoch grammatikalisch richtig ist und 
den im wesentlichen gleichen Sinn wie der ursprungliche Text 
ergibt. Allgemein gesagt ist das Grundprinzip bei der Ge- 
nerierung der Wortstellungsalternativen, daB in jeder 
Wortklasse, insbesondere auch in jeder Verbklasse, die zur 
Generierung der korrekten Wortstellungsalternativen not- 
wendigen Inf ormationen gespeichert sind. So kann bei- 
spielsweise die Reihenfolge der Konstituenten in den 
Subjekt-, den Komplement- und den Adjunkt-Attributen der 
jeweiligen lexikalischen Eintrage in einer Lexikon/Gram- 
matik-Stufe zu den jeweiligen Klassen definiert werden. Die 
Einrichtung zum Bestimmen einer Mehrzahl von Formulierungs- 
alternativen, die vorzugsweise ebenfalls als HPSG-System 
ausgefuhrt ist, ist dann in der Lage, die folgenden Wort- 
stellungsalternativen regelbasiert zu erzeugen (in Klammern 
dahinter stehen kanonische Huf fman-Codeworter fur die ein- 
zelnen Textbestandteile) : 



12345 (111), 12435 (110), 32145 (1001), 32154 (1000), 34215 
(0111), 35214 (0110), 42135 (0101), 45213 (0100), 45231 
(0011), 52134 (0010), 54213 (0001), 54231 (0000) (13 Wort- 
stellungsalternativen) . 

Die Binarfolgen hinter den einzelnen Wortstellungsalterna- 
tiven stellen die Teilinf ormationen dar, die der jeweiligen 
Wortstellungsalternative zugeordnet sind. Es zeigt sich, daB 
hier ein Code-Kontext mit 13 Codewortern verwendet wird, 
wobei drei Wortstellungsalternativen ein Codewort mit einer 
Lange von 3 Bit haben, wahrend die restlichen 10 Wortstel- 
lungsalternativen ein Codewort mit einer Lange von 4 Bit 
haben. 



Analog dazu wird die Lieferung einer Mehrzahl von Formulie- 
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rungsalternativen fur den Text durch Verwenden von Synonymen 
ftir die Textbestandteile durchgefiihrt . Nachfolgend sind 
Synonyme und in Klammern dahinter stehende kanonische Huff- 
man-Codeworter fiir die einzelnen Textbestandteile darge- 
stellt. 



Auto (111), Kraftwagen (110), Kraf tf ahrzeug (101), Wagen 
(100), Limousine (Oil), Personenkraf twagen (010), Pkw 
(0011), Automobil (0010), Fahrzeug (00011), Schese 
(00010), Vehikel (00001), Gefahrt (00000) (12 Synonyme) 

fahrt (11), rollt (10), bewegt sich fort (01), rast 
(001), gondelt (0001), braust (0000) (6 Synonyme) 

schnell (111), blitzartig (110), hurtig (101), rapide 
(1001), pfeilschnell (1000), kometenhaft (0111), blitz- 
schnell (0110), flott (0101), pf eilgeschwind (0100), 
rasch (0011) , rasant (0010) , geschwind (00011) , fix 
(00010), eilig (00001), flugs (00000) (15 Synonyme) 

- bei (1) , auf (0) (2 Worter mit ahnlichem Sinn nur in die- 
sem Kontext) 

glatter (11), schlittriger (10), vereister (011), spie- 
gelglatter (010), eisglatter (0011), rutschiger (0010), 
schlickriger (0001) , glitschiger (00001) , schlupfriger 
"(00000) (9~Synonyme) — 

- strafta (11), Fahrbahn (10) , HauptstraBe (011), LandstraBe 
(010) , Fernverkehrsstrafie (0011) , FahrstraBe (0010) , 
Fahrweg (0001), Fahrspur (0000) (8 Synonyme) 

- Hugel (11), Berg (10), Erhebung (011), AnhShe (0101), Ho- 
henzug (0100), Bodenerhebung (0011), Hohenrucken (0010), 
Steigung (00011), Hohe (00010), Buckel (00001), Hocker 
(00000) (11 Synonyme) 





Wieder ist zu sehen, daB jede Synonymklasse einen eigenen 




Code-Kontext bildet, derart, daB sich fur den Beispielsatz 7 
Synonym-Code-Kontexte ergeben, wobei fur beliebige andere 
Textbestandteile fur beliebige andere Beispielsatze eben- 
falls entsprechende Code-Kontexte durch die Einrichtung zum 
Bestimmen einer ^Mehrzahl von Formulierungsalternativen dyna- 
misch erzeugt bzw. von einem Speicher abgerufen werden kon- 
nen. In einer vorzugsweisen Realisierung ist ein solcher 
Speicher mit einem Lexikon oder Thesaurus gekoppelt. 

Aus diesem Beispiel ist zu sehen, daB haufig erwarteten oder 
verwendeten Synonpien vorzugsweise ktirzere Codes gegeben 
werden als weniger haufig erwarteten Synonymen. AuBerdem ist 
zu sehen, daB beim Auftauchen eines der Worter dieser Syno- 
^^^V nymliste genau alle Worter der Liste als Synonyme generiert 
werden miissen, damit ein vollstandiger Codebaum vorhanden 
ist, Im vorliegenden Beispiel miiBten also auch beim Auftre- 
ten von "Fahrzeug" nur genau die Auto-Synonyme generiert 
werden, nicht aber Worter wie beispielsweise "Lastwagen, 
Motorrad, usw." . Fur solche Effekte kann ein Ahnlich- 
keitsschwellwert vorgesehen werden, der dazu dient, eine 
S innver anderung zu eliminieren, die entstehen wiirde, wenn 
der Begriff "Auto" durch "Lastwagen" ersetzt werden wiirde. 

Die folgende Bitsequenz , die die zu verbergenden Informa- 
tionen darstellt: 




0010/0011/001/0101/0/10/0101 



wiirde den Satz 



"Uber die Anhohe rast der PKW blitzschnell auf eisglatter 
Fahrbahn • " 

codieren. 

Die Originalreihenf olge ohne eine Vertauschung der Stellung 
der Textbestandteile wiirde f olgendermaBen lauten: "Der PKW 
rast blitzschnell auf eisglatter Fahrbahn uber die Anhohe" . 
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Dies wttrde dem binaren Teil ohne das PrMfix fur die Wort- 
stellung entsprechen, der in Bitdarstellung lautet: 

0011/001/0101/0/10/0101 

Es sei darauf hingewiesen, daB die Schragstriche in der 
Bitdarstellung fur die zu verbergenden Inf ormationen nur aus 
optischen Grunden vorhanden sind. In der Praxis wird nichts 
derartiges codiert. Artikel und GroB/Kleinschreibung werden 
nach den jeweiligen Erf ordernissen durch die Einrichtung 20 
zum Bestimmen einer Mehrzahl von Formulierungsalternativen 
gesetzt. Zur Proposition "liber" gibt es hier kein Synonym. 
Deshalb bleibt sie unverandert. 

Es sei darauf hingewiesen, daft wirklich jede Bitsequenz, 
wenn sie nicht zu lang ist, einen giiltigen Satz roit 
ahnlicher Bedeutung erzeugt. Wird beispielsweise das 10. 
Bit, d. h. die zweite "0" im Symbol 001 fur "rasen" 
eliminiert, so erhalt man stattdessen "bewegt sich fort", 
also: "Uber die Anhohe bewegt sich der PKW blitzschnell auf 
eisglatter Fahrbahn fort." 

Wurde nun das 15. Bit, d. h. die letzte "1" im Symbol 0101 
fur "blitzschnell" eliminiert, so verbleibt bei der 
Selektierung des Adjektivs noch die Bitfolge 0100100101 im 
Datenstrom. Da ein Symbol 010 nicht in diesem Kontext 
-exi-stiert-7—da— die— Codes— prafix^frei—sind,_mu5 ein Bit zur 
Selektion des Adjektivs hinzugenommen werden. Es wird dann 
das Symbol 0100 selektiert, was fur "pf eilgeschwind" steht. 



Es verbleibt dann 100101 im Datenstrom. Die erste 1 wahlt 
"bei" statt "viber" wie im Beispiel mit einer 1 mehr. Im 
Datenstrom verbleibt dann noch 00101, wobei zunachst das 
Symbol 0010 selektiert wird, das fur "rutschiger" steht. 
SchlieBlich bleibt eine einzige 1 im zu verbergenden 
Datenstrom ubrig. Damit konnte nun entweder "StraBe" (11) 
oder "Fahrbahn" (10) selektiert werden. Diese Wahl ist 
vollig frei. Es wird somit durch die Bitsequenz 



• .... • 



0010/ 0011/ 001/ 0100/ 1/0010/ IX 

der Satz "Ufoer die Anhohe rast der PKW pf eilgeschwind bei 
rutschiger StraBe" erzeugt, wobei x willkiirlich zu 1 gesetzt 
wurde. Diese Bitsequenz unterscheidet sich nur von der 
Ausgangssequenz dadurch, daB hier das urspriingliche 15. Bit 
fehlt. 

In Abweichung vom beschriebenen Ausf uhrungsbeispiel konnte 
statt einer kanonischen Huf fman-Codierung auch eine einfache 
Huf fman-Codierung mit Baumen verwendet werden. Die kano- 
nische Codierung ermoglicht jedoch eine wesentlich effi- 
zientere Decodierung durch das Nachsehen in Tabellen anhand 
der ersten Codewortbits und durch die Beschrankung auf nur 
wenige effiziente additive/ subtraktive Operationen. Auch die 
kanonische Huf fman-Codierung ist der Technik bekannt. 

Im Vorangegangenen wurde darauf hingewiesen, daB kiirzeren 
Codewortern eine gebrauchlichere Satzstellung bzw. eine 
gebrauchlichere Synonymalternative zugeordnet werden kann. 
Dabei wird davon ausgegangen, daB kiirzere Codeworter hier 
haufiger in einem Datenstrom von zu verbergenden Informa- 
tionen auftreten, weshalb die gebrauchlicheren Alternativen 
bzw. Synonyme haufiger gewahlt werden. 

Im Nachf olgenden wird auf Fig. 3 eingegangen, in der das 
Verfahren, das zum Bestimmen einer Mehrzahl von Formulie- 
rungsalternativen fiir den Text ausgefuhrt wird, schematisch 
darcfestellt ist. Beispielhaft ist hier die Erzeugung von 
Alternativen fur eine Phrase nach dem HPSG-Gedanken darge- 
stellt. Zunachst wird in einem Schritt 3 00 der Kopf eines 
Satzes gesucht. Dies ist in der Regel ein finites Verb, das 
Pradikat. In einem Lexikoneintrag in der Lexikon/Grammatik- 
Stufe zu diesem Verb steht dann, welche Art von Komplementen 
und was fiir ein Subjekt das Verb zulaBt. Teilweise konnen 
auch Adjunkte oder idiomatische Wendungen im Lexikoneintrag 
ausgewiesen sein. Sowohl syntaktische wie auch semantische 
Inf ormationen konnen im Lexikon verzeichnet sein oder 
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mittels (lexikalischer) Regeln hergeleitet werden. So kann 
z. B. fiir ein Wort (Subjekt, Komplement oder Adjunkt) 
verzeichnet sein, ob es sich um ein lebendiges Wesen, einen 
Menschen, ein Tier, ein Objekt, einen abstrakten Begriff, 
usw. handelt. Auch konnen hier schon Inf ormationen iiber 
mogliche Wortstellungsalternativen abrufbar sein. Im 
Idealfall sind aus den lexikalischen Inf ormationen die 
wahrscheinlichkeiten fiir alle denkbaren Alternativen 
ableitbar, wie es in einem Schritt 3 02 angedeutet ist. Aus 
diesen Wahrscheinlichkeiten werden die Teilinf ormationen 
erzeugt, die jeder Formulierungsalternative, d. h. jedem 
Synonym und jeder Wortstellungsalternative zugeordnet sind. 
Es konnen also Synonyme zum Kopf der Phrase, d. h. des 
Textes gesucht werden, Wendungen mit gleicher Bedeutung 
gesucht werden Oder Wortstellungsalternativen aufgestellt 
werden. Fig. 3, auf die spSter eingegangen wird, zeigt eine 
detailliertere Erlauterung des Schritts 302. 

Die lexikalischen Inf ormationen des Kopfes engen die Mog- 
lichkeit fiir die restlichen Glieder des Satzes ein. In- 
nerhalb dieser Teilphrasen oder Textbestandteile wird 
wiederum nach einem Kopf gesucht, wie es in einem Schritt 
3 03 angedeutet ist. Dies kann beispielsweise eine Proposi- 
tion innerhalb einer Prapositionalphrase sein oder aber ein 
Verb in einem Nebensatz . Der ProzeB setzt sich rekursiv 
fort. Somit kSnnen wortstellungsalternativen generiert 
werd en"; — sobald— d i re— Ana-ly se— de s-Satz e s-we i t_genug_fortgen_ 



schritten ist. Wurde im Schritt 300 kein Kopf gefunden, 
entW*> ri^T- wpiI keiner vorhanden ist, oder weil sich 
Schwierigkeiten beim sprachlichen Analysieren oder Parsen 
ergeben, konnen immerhin noch Synonyme generiert werden und 
feststehende Wendungen durch ahnlich-bedeutende ersetzt 
werden (Schritt 3 04) . 

Grundsatzlich muB beim Erzeugen einer Mehrzahl von Formu- 
lierungsalternativen berucksichtigt werden, daB alle For- 
mulierungsalternativen fUr den Text grammatikalisch richtig 
sind und den im wesentlichen gleichen Sinn im gleichen 




Kontext unter Berucksichtigung einer Ahnlichkeitsschwelle 
haben, derart, daB der modifizierte Text nicht derart 
auffallig ist, daB in ihm geheime Inf ormationen vermutet 
werden . 




Fig. 4 zeigt die Behandlung einer einzelnen Alternative i. 
Jede Alternative wird zunachst auf ihre Alternativenklasse 
zuriickgef tthrt (Schritt 400) . Dies kann beispielsweise die 
Klasse der korrekten Wortstellung fur diesen Satz sein oder 
die semantische Klasse, der ein Wort angehort. In einem 
Schritt 402 wird entweder auf eine existierende Wahrschein- 
lichkeitsverteilung, d. h. auf bereits existierende Teilin- 
f ormationen, zurtickgegrif f en, oder es kann nach bestimmten 
Regeln, die auch der Vorrichtung zum Extrahieren von Inf or- 
mationen (Fig. 2) bekannt sind, eine Wahrscheinlichkeits- 
verteilung, d. h. Teilinf ormationen, erzeugt werden. Keine 
Neugenerierung ist erf orderlich, wenn der vom Benutzer an- 
gegebene Ahnlichkeitsschwellwert so klein ist, daB er nicht 
groBer ist als die minimale Distanz zwischen der jeweils 
aktuellen und der benachbarten semantischen Konzeptgruppe. 
Ist der Ahnlichkeitsschwellwert hoher, so sollten alle 
semantischen Konzeptgruppen, deren Abstand zur Kernsemantik 
geringer als dieser Schwellwert 1st, zu einer semantischen 
Gruppe zusammengef aBt werden. Ein bevorzugtes Verf ahren zum 
Berechnen der semantischen Ahnlichkeit in Taxonomien wurde 
vorgestellt in Jay J. Jiang and David M. Conrath (1997) , 
"Semantic similarity based on corpus statistics and lexical 
taxonomy", in Prodeedings of International Conference 
Research on Computationa l Linguistics (ROC LING X) , Taiwan. 

Grundsatzlich werden einfach die Gewichte aller beteiligten 
Elemente zu einem Gesamtgewicht aufsummiert, urn daraus dann 
auf die Wahrscheinlichkeiten und somit auf die Teilinforma- 
tionen der einzelnen Alternativen zu schlieBen. Dabei soll- 
ten die Gewichte, die einer entfernten semantischen Gruppe 
angehoren, entsprechend herunterskaliert werden. Eine 
schnelle aber ungenaue Variante besteht darin, nach grober 
Abschatzung Wahrscheinlichkeits- oder Codebereiche fur die 
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Alternativen zu reservieren, die in einer semantischen Grup- 
pe liegen. 

Falls die Einrichtung 22 zum Auswahlen (Fig. 1) eine arith- 
metische Codierung/Decodierung verwendet, kann ganz ohne Ge- 
nauigkeitsverlust ein Intervall fur jede semantische Gruppe 
reserviert werden, was sich aus der Gesamtsumme der dort 
vorhandenen Gewichte herabskaliert entsprechend der Ent- 
ferntheit der Konzepte ergibt. Im Falle einer bitbasierten 
Auswahleinrichtung 22 konnte einfach ein Codebereich r z. B. 
alle Codes, die mit "110" anfangen, fur die entfernte se- 
mantische Gruppe reserviert werden- Ein Schritt 4 04 zeigt 
die Funktion der Auswahleinrichtung 22, d. h. die Codierung 
d er geheimen Nachricht durch Wahl der den Nachrichtenbits 
entsprechenden Alternative. AnschlieBend wird zur nachsten 
Alternative i+1 ubergegangen. 

Sollen mehrere geheime Nachrichten, d. h. mehrere zu ver- 
bergende Inf ormationen, in den Text eingebracht werden, so 
wird typischerweise vor Beginn der ersten geheimen Infor- 
mationen eine Praambel in den Strom eingefugt, die die 
Anzahl der vorhandenen geheimen Datenquellen und auch die 
Bitpositionen ihres Anfangs im Datenstrom codiert. Typi- 
scherweise wird jede geheime Datenquelle mit einem anderen 
Schltissel verschlusselt und mit Kontrollinf ormationen 
versehen. Bei der Decodierung wird dann der Benutzer nach 
~dem — ScKXusswr/den — Schlusseln— gef ragt— und — es— wird — nur — der^ 
geheime Teil decodiert, zu dem der Schlussel palit. Ob der 
rh 1 fl *i ^ ul_ na-R-t— kann— wledenum— aus_ den_Kontro 1 1 irv£pr-mat ionen 



oder aus den decodierten Daten selbst geschlossen werden. 
Soli es sich bei dem decodierten Text, d. h. dem Text am 
Ausgang des Extrahierers 50, urn einen sinnvollen Text 
handeln und ist dies nicht der Fall, so war der Schlussel 
f alsch. 



Bei einer auf wendigeren Implementation der vorliegenden 
Erfindung kann der Benutzer die Generierung und die Auswahl 
der Alternativen spezifischer beeinf lussen, indem er 
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beispielsweise angibt, welche Worter vermieden werden sol- 
len, beispielsweise um besonders alterttimliche Synonyme 
auszuschlieBen, ob der modifizierte Text eine minimale, eine 
mittlere oder eine maximale Satzlange haben soil, ob der 
neue Text eine bestimmte Sprachkomplexitat oder ein bestimm- 
tes Sprachniveau, wie z. B. gehoben, einfach, umgangssprach- 
lich, historisch usw. haben soil, welche Satzbaumodelle und 
Wortstellungsmodelle bevorzugt werden, ob der Text moglichst 
stark verandert werden soli, ob versucht werden soil, die 
Lesbarkeit des Textes zu erhohen, welche Liste von Wortern 
durch andere grundsatzlich ersetzt werden sollen, und wie 
mit vermuteten Fehlern umgegangen werden soil, beispiels- 
weise mittels einer automat ischen Korrektur, einer in- 
teraktiven Korrektur, oder ob die Fehler grundsatzlich 
ignoriert werden sollen. Voraussetzung daflir ist jedoch 
immer, wie bereits oft erwahnt wurde, daft die Grammatik 
korrekt wiedergegeben werden kann, d. h. daS insbesondere 
f lektierte Verbformen angepaftt werden. Solche Optionen 
werden typischerweise am Beginn des Datenstroms oder in 
einer auBeren Codierungsebene in die zu verbergenden 
Informationen eincodiert. Vorteilhaft ist es, jeweils kurze 
komprimierte Symbole fur die Codierung eines typischen 
Satzes von Konf igurationsdaten einzusetzen. 

Das Ende des geheimen Datenstroms kann im allgemeinen Fall 
der Datenkompression auf mehrere Arten und Weisen codiert 
werden, und zwar einerseits durch eine explizite Speicherung 
der Bitlange in der Praambel der zu komprimierenden Daten, 
nder durch Codierung einer Variante mit der Bedeutung "Ende^ 
des geheimen Datenstroms" . Damit die letztere Variante 
moglich ist, miiftte jedoch in jedem Kontext ein solches 
Symbol explizit codiert werden. Dies erhoht jedoch die 
Entropie und damit die Lange der komprimierten Daten. Im 
Falle des Codiergangs zum Verbergen geheimer Daten ist diese 
zweite Variante ohnehin nicht moglich: Eine Bitsequenz im 
geheimen Datenstrom konnte vorzeitig das Ende-Symbol 
selektieren und damit eine Fehlinf ormation codieren. 



Bei einem bevorzugten Ausf uhrungsbeispiel der vorliegenden 
Erfindung benutzt die Einrichtung 2 0 zum Bestimmen einer 
Formulierungsalternative (Fig. 1) bzw. die Einrichtung 58 
zum Lief em von Teilinf ormationen (Fig. 2) einen Wort- 
speicher in Form eines Baumes, z. B. eines Tries (eine 
Baumdatenstruktur fur Buchstaben, abgeleitet von "infor- 
mation retrieval") oder vorzugsweise eines Graphen benutzt, 
bestehend aus (a) Wort-Vollf ormen, also flektierten Wortern, 
die dann zu anderen flektierten Wortern in Beziehung gesetzt 
werden oder (b) morphologisch-syntaktische Zerlegungen der 
Worter, etwa nach Flektionsklassen und insbesondere eine 
Aufspaltung in Wortprafixe, Wortstamme und Wortsuffixe, 

•wobei lediglich die Wortstamme oder Wortpraf ix-Wortstamm- 
Kombinationen explizit als Synonyme in Beziehung gesetzt 
werden miissen und die jeweiligen flektierten Formen ent- 
sprechend dem aktuellen Bedarf beim jeweils vorgef undenen 
Wort anhand von Flektionsdaten analysiert und fur ein 
gewahltes Synonym entsprechend generiert werden, 

Synonymverweise sind dabei organisiert sind als (a) Kette 
von synonymen Bedeutungen eines Wortes, die erstens ring- 
formig aufeinander verweisen und zweitens implizit durch 
eine Ordnungsvorschrif t wie die lexikalische Reihenfolge 
oder Anordnung nach Vorkommenswahrscheinlichkeit oder 
explizit durch eine Kennzeichnung des Ranges eines oder 
mehrerer Elemente geordnet sind oder als (b) Gruppe von als 
synonym — betrachteten — Wortern — oder — a-l-s — Ver-weise — auf — die. 
Synonyme mit der Eigenschaft, dafi umgekehrt auch von den 
betroffenen Synonymen auf diese Gruppe verwiesen wird oder 
diese Gruppe als Wert eines Synonyms gespeichert wird. 
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Patentanspriiche 

1. Vorrichtung (10) zum Verbergen von Inf ormationen in 
einem Text, mit folgenden Merkmalen: 

einer Einrichtung (12) zum Liefern des Textes; 

einer Einrichtung (18) zum sprachlichen Analysieren des 
Textes, urn Textbestandteile zu liefern; 

einer Einrichtung (20) zum Bestimmen einer Mehrzahl von 
Formulierungsalternativen fur den Text durch Variieren 
der Reihenfolge der Textbestandteile und/oder durch 
Verwenden von Synonymen fiir die Textbestandteile, wobei 
jede Formulierungsalternative fiir den Text grammati- 
kalisch richtig ist und den im wesentlichen gleichen 
Sinn wie der Text hat, wobei jeder Reihenfolge und/oder 
jedem Synonym bestimmte Teilinf ormationen zugeordnet 
sind; 

einer Einrichtung (22) zum Auswahlen einer Formulie- 
rungsalternative aus der Mehrzahl von Formulierungs- 
alternativen, derart, daB die Teilinf ormationen, die 
der ausgewahlten Formulierungsalternative zugeordnet 
sind, zumindest einem Teil der zu verbergenden Inf or- 
mationen entsprechen; und 

einer Einrichtung (24) zum Ausgeben der Formulierungs- 
iDhernative f die einen modif izierten Text bildet, wobei 
in dem modif izierten Text die zu verbergenden Inf orma- 
tionen verborgen sind, 

2. Vorrichtung (10) nach Anspruch 1, bei der die Einrich- 
tung (18) zum sprachlichen Analysieren ein Parser, ins- 
besondere ein hochlexikalisierter unif ikationsbasierter 
Parser und speziell ein HPSG-Parser ist. 

3. Vorrichtung (10) nach Anspruch 1 oder 2, bei der die 
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Einrichtung (20) zum Bestimmen einer Mehrzahl von For- 
mul ierungsa 1 1 er na t i ven eine Lexikon/Grammatik-Stuf e 
aufweist, derart, daB grammatikalisch richtige Formu- 
lierungsalternativen geliefert werden. 

4. Vorrichtung nach Anspruch 3, bei der in der Lexi- 
kon/Grammatik-Stuf e Synonyme fur Textbestandteile sowie 
fur jedes Synonym eindeutige Teilinf ormationen gespei- 
chert sind wie syntaktische, semantische, kontextuelle 
und statistische Inf ormationen, 

Vorrichtung (10) nach einem der vorhergehenden Anspru- 
che, 

bei der jeder Reihenfolge der Textbestandteile und/oder 
jedem Synonym als Teilinf ormationen eine Gewichtung 
zugeordnet ist, wobei die Gewichtung derart bestimmt 
ist, dafi alle Gewichtungen fur die Reihenfolge bzw. die 
Synonyme zusammen eine Wahrscheinlichkeit von 1 erge- 
ben , und 

bei der die Einrichtung (22) zum Auswahlen angeordnet 
ist, urn gemafc den Regeln der arithmetischen Decodierung 
jeweils eine Formulierungsalternative zu wahlen, ge- 
steuert durch die als codierte Daten aufgefafcten gehei- 
men Daten, 



6. Vorrichtung (10) nach einem der Anspruche 1 bis 4, bei 
der die Teilinf ormationen Huffman-Codeworter sind, wo- 
bei folgende Gleichung gilt: 

n 

S 2 -1 i = 1,0 
i - 1 

wobei l i die Lange in Bit des i-ten Huf f man-Codeworts 
ist, und wobei n die Anzahl von Huf fman-Codewor tern 
eines Kontextes ist, wobei alle Synonyme fur einen 





Textbestandteil einschlieBlich des Textbestandteils 
zusammen einen eigenen Kontext bilden, wobei alle ver- 
schiedenen Reihenfolgen von Textbestandteilen ein- 
schlieBlich der Reihenfolge der Textbestandteile im 
Text einen eigenen Kontext bilden, derart, daB alle 
beliebigen zu verbergenden Inf ormationen einen Strom 
von gultigen Huf f man-Codewortern darstellen. 

Vorrichtung (10) nach Anspruch 5, bei der die zu 
verbergenden Inf ormationen eine Bitsequenz aufweisen, 
wobei die Einrichtung (2 2) zum Auswahlen angeordnet 
ist, urn von dem Anfang der Bitsequenz so viele Bits zu 
nehmen, bis die Zahl, die diese Bits darstellen, ein- 
deutig in einem speziellen der Wahrscheinlichkeits- 
intervalle liegt, die durch die Gewichtungen bestimmt 
sind, woraufhin die Einrichtung (22) zum Auswahlen die 
Formulierungsalternative auswahlt, die der dem spe- 
ziellen Wahrscheinlichkeitsintervall zugeordneten 
Gewichtung entspricht, woraufhin die Einrichtung (22) 
zum Auswahlen eine weitere Intervallschachtelung 
vornimmt f urn die nachste Formulierungsalternative zu 
wahlen. 



Vorrichtung (10) nach Anspruch 6, bei der die Einrich- 
tung zum Auswahlen (22) angeordnet ist, um eine Huff- 
man-Decodierung durchzuf uhren, wobei dieselbe nach- 
einander auf verschiedene Huf fman-Code-Kontexte zu- 
greift, die durch die Textbestandteile aus einer Anzahl 
von durch die Einr i chtuncf (20) zum Bestimmen einer 
Mehrzahl von Formu 1 i erungsa 1 1 er na t i ven bereitgestellten 
Formulierungsalternativen selektiert werden, wobei die 
Eingabe in die Huf fman-Decodierung die zu verbergenden 
Inf ormationen sind, und wobei die Ausgabe aus der Huff- 
man-Decodierung der modifizierte Text ist. 




9, 



Vorrichtung nach einem der Anspriiche 3 bis 8, bei der 
der Text einen Satz aufweist, wobei jeder Textbestand- 
teil zumindest ein Wort aufweist, und wobei die Syno- 
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nyme fur jedes Wort in der Lexikon/Grammatik-Stuf e 
zusammen mit den entsprechenden Teilinf ormationen 
gespeichert sind, wahrend die Teilinf ormationen fur 
jede unterschiedliche Reihenfolge der Textbestandteile 
nach einer Modellierung realer linguistischer Gesetze 
durch deklarative Regeln, Constraints oder feste Im- 
plementationen in Software vorgegeben sind. 

10. Vorrichtung (10) nach Anspruch 9, bei der die Einrich- 
tung (22) zum Auswahlen angeordnet ist, um einen ersten 
Abschnitt der zu verbergenden Inf ormationen fur die 
Auswahl der Reihenfolge der Textbestandteile zu ver- 
wenden und die nachf olgenden Abschnitte fur die Auswahl 
der Synonyme zu verwenden und wobei die Reihenfolge der 
ausgewahlten Synonyme eine unter einer oder mehreren 
linguistisch moglichen Reihenfolgen selektierte ist und 
von der Reihenfolge der Textbestandteile im Text unab- 
hangig ist. 

11. Vorrichtung (10) nach einem der vorhergehenden Ansprii- 
che, die ferner folgendes Merkmal aufweist: 

eine Einrichtung zum Verschlusseln und/oder Kompri- 
mieren der zu verbergenden Inf ormationen, wodurch 
verschliisselte und/oder komprimierte zu verbergende 
Inf ormationen erzeugt werden, die in die Einrichtung 
(22) zu^AlIswahren— einspersbar-sind^ 

12. Vorrichtung nach einem der vorhergehenden Anspruche, 
bei der die Einrichtung (18) zum sprachlichen Analysie- 
ren angeordnet ist, keine Textbestandteile zu liefern, 
fur die die Korrektheit der Umf ormulierung nicht garan- 
tiert werden kann, und/oder bei der die Einrichtung 
(20) zum Bestimmen von Formu 1 ierungsa 1 1 er na t i ven ange- 
ordnet ist, um nur solche Formulierungsalternativen 
anzubieten, fur die sichergestellt ist, da/3 bei deren 
Analyse wieder der gleiche Satz von Formulierungsalter- 
nativen erhalten werden kann. 
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13. Vorrichtung nach einem der vorhergehenden Anspriiche, 
bei der es einen of fent lichen Text und geheime Daten 
gibt, wobei die Vorrichtung (10) eine Steuereinrichtung 
aufweist, die derart angeordnet ist, um die Informatio- 
nen der geheimen Daten der Einrichtung (22) zum Auswah- 
len zuzufiihren, derart, daB dieselben durch Modifizie- 
ren des offentlichen Textes in demselben verborgen 
werden . 

14. Vorrichtung nach Anspruch 13, bei der die zu einer 
Kompression und/oder Verschliisselung verwendeten Sta- 
tistiken vom offentlichen Text abhangig sind, so da3 
Ubereinstimmungen von Datenf ragmenten im offentlichen 
Text und den geheimen Daten zur effizienten Kompression 
genutzt werden. 

15. Vorrichtung (10) nach einem der vorhergehenden Ansprii- 
che, bei der die Einrichtung (20) zum Bestimmen der 
Formu lierungsa lterna t i ven uber die Teilinf ormationen 
steuerbar ist, um einen bestimmten Stil einzuhalten, 
insbesondere um bestimmte Formulierungsalternativen zu 
bevorzugen bzw. auszuschlieBen, wie z. B. bestimmte 
Worter, bestimmte Satzlangen, welche Sprachkomplexitat , 
welches Sprachniveau, welche Satzbau- und Wortstel- 
lungsmodelle, welche Erzahlperspektive, welchen ethni- 
schen Schwerpunkt bzgl. der Herkunft der Worter der 
modifizierte Text haben soil, welche Liste von zu ver- 
maidendftn Wortern verwendet werden soil,, wie mit ver- 
muteten Fehlern im Text umzugehen ist und ob neue Feh- 
ler eingebaut werden diirfen. 

16. Vorrichtung nach einem der vorhergehenden Anspriiche, 
bei der eine Ahnlichkeitsschwelle vorgebbar ist, der- 
art, daB die Einrichtung (20) zum Bestimmen von Formu- 
lierungsalternativen ahnliche Formulierungsvarianten 
fur den Text bestimmt, deren semantische Unterschiede 
zur Ausgangsalternative unter der Ahnlichkeitsschwelle 
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liegen, wahrend Formulierungsalternativen, deren se- 
mantische Unterschiede zur Ausgangsalternative iiber der 
Ahnlichkeitsschwelle liegen, verworfen werden. 

17 . Vorrichtung nach Anspruch 15 , bei der die Textmenge 
begrenzt ist, wobei die Ahnlichkeitsschwelle derart 
bemessen ist, dafi gerade alle zu verbergenden Infor- 
mationen in der begrenzten Textmenge untergebracht 
werden konnen. 





18. Vorrichtung (10) nach einem der vorhergehenden An- 
spruche, bei der die Einrichtung (20) zuirt Bestimmen 
einer Mehrzahl von Formulierungsalternativen angeordnet 
ist, urn dynamisch die Formulierungsalternativen zu 
bestimmen, und um dynamisch die Teilinf ormationen zu 
erzeugen, die jeder Formu 1 ierungsa 1 1 er nat i ve zugeordnet 
sind. 

19. Vorrichtung (10) nach einem der vorhergehenden An- 
spruche, bei der die Einrichtung (2 0) zum Bestimmen 
einer Mehrzahl von Formulierungsalternativen angeordnet 
ist, um nur die Formulierungsalternative aus der Mehr- 
zahl von Formulierungsalternativen auszugeben, die 
durch die Einrichtung (22) zum Auswahlen aufgrund der 
zu verbergenden Inf ormationen ausgewahlt wird. 

~2o~ Vorrichtung— (50) — zum— Extrah-ieren— von— in— einem— modifi^- 

zierten Text verborgenen Inf ormationen, mit folgenden 
Merkmalen: 



einer Einrichtung (52) zum Liefern des modif izierten 
Textes ; 

einer Einrichtung (56) zum sprachlichen Analysieren des 
modif izierten Textes, um Textbestandteile des modif i- 
zierten Textes zu liefern; 

einer Einrichtung (58) zum Liefern von Teilinf ormatio- 




nen, die der Reihenfolge der Textbestandteile und/oder 
den sprachlichen Bedeutungen der Textbestandteile zu- 
geordnet sind, wobei die Einrichtung zum Liefern von 
Teilinf ormationen die gleichen Teilinf ormationen lie- 
fert, die bei dem Verbergen der Inf ormationen, um den 
modif izierten Text zu erzeugen, der Reihenfolge der 
Textbestandteile und/oder den sprachlichen Bedeutungen 
der Textbestandteile zugeordnet waren; 

einer Einrichtung (60) zum Kombinieren der Teilinfor- 
mationen, die fiir den modif izierten Text durch die Ein- 
richtung zum Liefern (58) von Teilinf ormationen gelie- 
fert wurden, um die in dem modif izierten Text verbor- 
genen Inf ormationen zu erhalten; und 

einer Einrichtung (62) zum Ausgeben der verborgenen 
Inf ormationen . 

21. Vorrichtung (50) nach Anspruch 20, bei der die Teil- 
inf ormationen Gewichtungen sind, wobei die Einrichtung 
(60) zum Kombinieren der Teilinf ormationen eine arith- 
metische Codierung ausftihrt, um die verborgenen Inf or- 
mationen zu extrahieren. 

22. Vorrichtung (50) nach Anspruch 20, bei der die Teil- 
inf ormationen einfache Oder kanonische und insbesondere 
prafix-freie Huf fman-Codeworter sind, wobei die Ein- 
richtung (60) zum Kombinieren der Teilinf ormationen 
eine Huf fman-Codierunq ausftihrt, wobei die Code-Kon- 
texte, die zur Huf fman-Codierung verwendet werden, 
durch die Einrichtung (58) zum Liefern selektiert wer- 
den und den Code-Kontexten entsprechen, die wahrend des 
Verbergens von Inf ormationen eingesetzt wurden. 

23. Vorrichtung (50) nach einem der Anspruche 2 0 bis 22, 
bei der die Teilinf ormationen, die beim Verbergen ver- 
wendet wurden, zunachst die Reihenfolge der Textbe- 
standteile und daran anschlieBend die Synonyme der 
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Textbestandteile in einer vorbestimmten Reihenfolge 
betreffen, wobei die Einrichtung (60) zum Kombinieren 
der Teilinf ormationen angeordnet ist, urn aus der Rei- 
henfolge der Textbestandteile des modif izierten Textes 
zunachst die Teilinf ormationen, die sich auf die Rei- 
henfolge beziehen, abzuleiten und dann ausgehend von 
einer vorgegebenen Reihenfolge der Textbestandteile 
nacheinander die Teilinf ormationen, die den einzelnen 
Textbestandteilen zugeordnet sind, abzuleiten. 

24. Vorrichtung (50) nach einem der Anspriiche 20 bis 23, 
bei der die Einrichtung (58) zum Liefern von Teilinfor- 
mationen ferner folgendes Merkmal aufweist: 

eine Einrichtung zum Bestimmen einer Mehrzahl von For- 
mulierungsalternativen fur den modif izierten Text durch 
Variieren der Reihenfolge der Textbestandteile und/oder 
durch Verwenden von Synonymen oder Paraphrasen fur die 
Textbestandte i le , wobe i j ede Formul ierungsa 1 ternat ive 
fur den Text grammatikalisch richtig ist und den im 
wesentlichen gleichen Sinn wie der Text hat, wobei je- 
der Reihenfolge und/oder jedem Synonym oder jeder Para- 
phrase bestimmte Teilinf ormationen zugeordnet sind, 

wobei die Einrichtung (58) zum Liefern von Teilinf orma- 
tionen angeordnet ist, urn auf die Einrichtung zum Be- 

st lnunen — einer — Mehrzahl — von — Formu-l-ierungsa-l-ternati-ven- 

zuzugreifen, urn die Teilinf ormationen, die sich auf die 
Reihenfolge und/oder die sprachliche Bedeutung der 
Textbestandteile des modif izierten Textes beziehen, 
wieder zugewinnen . 

25. Verfahren zum Verbergen von Inf ormationen in einem 
Text, mit folgenden Schritten: 

Liefern des Textes; 

sprachliches Analysieren des Textes, urn Textbestand- 




teile zu liefern; 

Bestimmen einer Mehrzahl von Formulierungsalternativen 
fur den Text durch Variieren der Reihenfolge der Text- 
bestandteile und/oder durch Verwenden von Synonymen fur 
die Textbestandteile, wobei jede Formulierungsalter- 
native fur den Text grammatikalisch richtig ist und den 
im wesentlichen gleichen Sinn wie der Text hat, wobei 
jeder Reihenfolge und/oder jedem Synonym bestimmte 
Te i 1 inf ormat ionen zugeordnet s ind ; 

Auswahlen einer Formulierungsalternative aus der Mehr- 
zahl von Formulierungsalternativen, derart, daB die 
Teilinf ormationen, die der ausgewahlten Formulierungs- 
alternative zugeordnet sind, den zu verbergenden Infor- 
mationen entsprechen; und 



Ausgeben der Formulierungsalternativen, die einen mo- 
dif izierten Text bilden, wobei in dem modif izierten 
Text die zu verbergenden Inf ormationen enthalten sind. 

26. Verfahren zum Extrahieren von in einem modif izierten 
Text verborgenen Inf ormationen, mit folgenden Schrit- 
ten: 

Liefern des modif izierten Textes; 

sprachliches Analysieren des modif izierten Textes, um 
Textbestandteile des modif izierten Textes zu liefern ; 




Liefern von Teilinf ormationen, die der Reihenfolge der 
Textbestandteile und/oder den sprachlichen Bedeutungen 
der Textbestandteile zugeordnet sind, wobei die glei- 
chen Teilinf ormationen geliefert werden, die bei dem 
Verbergen der Inf ormationen, um den modif izierten Text 
zu erzeugen, der Reihenfolge der Textbestandteile 
und/oder den sprachlichen Bedeutungen der Textbestand- 
teile zugeordnet waren; 
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Kombinieren der Teilinf ormationen, die fur den modi- 
fizierten Text durch den Schritt des Lieferns von Teil- 
inf ormationen geliefert wurden, um die in dem modifi- 
zierten Text verborgenen Inf ormationen zu erhalten; und 

Ausgeben der verborgenen Inf ormationen. 

27. Vorrichtung nach Anspruch 1 oder 20, bei der die Ein- 
richtung (20) zum Bestimmen von Formulierungsalternati- 
ven bzw. die Einrichtung (58) zum Liefern von Teilin- 
f ormationen angeordnet ist, um einen Wortspeicher in 
Form eines Baumes oder eines Graphen zu benutzen, der 
besteht aus (a) Wort-Vollf ormen, also flektierten Wor- 
tern, die dann zu anderen flektierten Wortern in Bezie- 
hung gesetzt sind oder (b) morphologisch-syntaktische 
Zerlegungen der Worter nach Flektionsklassen und 
insbesondere eine Aufspaltung in Wortprafixe, Wortstam- 
me und Wortsuffixe, wobei lediglich die Wortstamme oder 
Wortpraf ix-Wortstamm-Kombinationen explizit als Synony- 
me in Beziehung gesetzt sind und die jeweiligen flek- 
tierten Formen entsprechend dem aktuellen Bedarf beim 
jeweils vorgef undenen Wort anhand von Flektionsdaten 
analysiert und fur ein gewahltes Synonym entsprechend 
generiert werden. 



~28^ Vorrichtung nacR - Anspruch 27~ — dadurch- gekennzeichnet^- 
daB Synonymverweise entweder organisiert sind als (a) 
Kette von -synonvmen_ELe^Leutungen eines Wortes, die er- 
stens ringformig aufeinander verweisen und zweitens 
implizit durch eine Ordnungsvorschrif t wie die lexi- 
kalische Reihenfolge oder Anordnung nach Vorkommens- 
wahrscheinlichkeit oder explizit durch eine Kennzeich- 
nung des Ranges eines oder mehrerer Elemente geordnet 
sind, oder als (b) Gruppe von als synonym betrachteten 
Wortern oder als Verweise auf die Synonyme mit der 
Eigenschaft, daB umgekehrt auch von den betroffenen 
Synonymen auf diese Gruppe verwiesen wird oder diese 
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Gruppe als Wert eines Synonyms gespeichert wird. 
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Vorrichtung und Verfahren zum Verbergen von inf ormationen 
und Vorrichtung und Verfahren zum Extrahieren von 

Inf ormationen 



Zusammenf assung 

Eine Vorrichtung zum Verbergen von Inf ormationen in einem 
Text umfafct eine Einrichtung zum Liefern des Textes, eine 
Einrichtung zum sprachlichen Analysieren des Textes, urn 
Textbestandteile zu liefern, eine Einrichtung zum Bestimmen 
einer Mehrzahl von Formulierungsalternativen fur den Text 

•durch Variieren der Reihenfolge der Textbestandteile 
und/ oder durch Verwenden von Synonymen fur die Textbestand- 
teile, wobei jede Formulierungsalternative fur den Text 
grammatikalisch richtig ist und den im wesentlichen gleichen 
Sinn wie der Text hat, wobei jeder Reihenfolge und/oder 
jedem Synonym oder jeder Paraphrase bestimmte Teilinforma- 
tionen zugeordnet sind, eine Einrichtung zum Auswahlen einer 
Formulierungsalternative aus der Mehrzahl von Formulierungs- 
alternativen, derart, daB die Teilinf ormationen, die der 
ausgewahlten Formulierung zugeordnet sind, den zu verber- 
genden Inf ormationen entsprechen, und eine Einrichtung zum 
Ausgeben der Formulierungsalternative, die einen modifizier- 
ten Text bildet, wobei in dem modif izierten Text zu verber- 
gende Inf ormationen enthalten sind. Eine Vorrichtung zum 
Extrahieren zerlegt den modiTizierten T^tT^irr^eine— Textbe— 
standteile und verwendet dann die diesen Textbestandteilen 
iZ± igrnrrlnr1-pn Tei 1 i nf nr=mfl4^mfifh — um— <fll e verhorgenen Inf or- 
mationen wieder zu extrahieren. Damit konnen zu verbergende 
Informationen flexibel und unauffallig sowie in hoher Menge 
in einen beliebigen Text eingebracht werden. 
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